Cargar los datos

¿Cuál es el precio de las casas más recientes construidas?

pregunta1

Como se observa en la grafica la casa identificada con el id 516 con un estilo de viviendo 1Fam (Unifamiiliar), y dicho terreno cuenta con una cantidad de 12220 de pies cuadrados, se encuentra a un precio de 402861 dolares, siendo la mas cara de las casas mas recientes. Cabe mencionar que esta casa fue construida en el año 2009. Ademas, cabe mencionar que las ultimas casas construidas tuvieron en su mayoria el mismo estilo de vivienda. Y se obtuvo que el promedio del tamaño de estas recientes casas es de 8929.9 dolares.

pregunta1.1

¿Cuántas casas se han remodelado en el transcurso de los años?

pie(slices,labels = lbls, col=rainbow(length(lbls)),
    main="Porcentaje de casas remodeladas")

Como se observa en la grafica de pie el 52% de las casas registradas en la base de datos han sido remodeladas, la mayoria de estos debido a que fueron construidas desde hace años.

¿Cuáles son las casas más grandes?

pregunta3

Como se observa la casa mas grande es la casa con identificador 314 con un precio de 375000 dolares. Sienda una vivienda de tipo 1Fam (Uni familiar), con una evaluacion de material de construccion de 7/10 siendo una puntuacion alta, y una puntuacion de 5/10 en condicion de la casa, siendo una nota relativamente baja, esto debido a que el año de construccion de esta casa es vieja, fue construida el año 1965 y no ha tenido remoledaciones, sin embargo su gran tamaño lo vale, liderando las casa con una cantidad de 215245 pies cuadrados equivalente a 19,996.91 metros cuadrados. Un dato curioso a mencionar es que estas 5 casas mas grandes, todas fueron construidas durante los años 50 o mas. Siendo construidas en los siguientes años, 1965, 1965, 1958, 1971, 1975. Sin embargo por su edad tiene una nota promedio de 5.6/10 demostrando que su edad afecta la estructura. No obstante, el tamaño promedio de estas 5 es de 1.44963^{5} pies cuadrados, equivalente a 13467.50 metros cuadrados.

¿Cuáles son los tipos de viviendas con mejores puntuaciones?

pregunta4

Como se observa en la grafica la puntuacion mas alta la posee la vivienda 2fmCom que son casas para dos familias, y en segundo lugar se tienen las casas 1Fam casas para una familia. Sin embargo, en esta grafica vemos la puntuacion del estado de las casas, ahora veremos la calidad de acabados de cada tipo de vivienda.

pregunta4.1

En las ultimas dos graficas se demostro que las viviendas para dos familias tenian mejor puntuacion en temas de estado de la vivienda, sin embargo, la ultima grafica demostro que las viviendas con mejores acabados son las viviendas TwnhsE que son las casas adosadas. Y nuevamente en segundo lugar las casas unifamiliar.

¿Cual es el precio de venta mas alto registrado?

pregunta1A

Como se puede observar en la grafica de barras anterior, la cada que mas valor ha tenido es la que se encuentra con el Id 692, siendo la propiedad con mayor precio de venta, con un precio de 755000 dolares, seguido con la propiedad 1183 con un precio de venta de 745000

¿Que estilo de vivienda es el mas vendido?

pregunta2A

La grafica antes vista tiene una forma bastante vistosa, como se puede apreciar el estilo de vivienda mas vendido es 1Story, la cual sobre sale con una cantidad extremadamente vistosa y para aclararlo este estilo hace referencia a que la casa cuenta con un solo piso o un solo nivel. El estilo que le continua es 2Story, por lo que se sabe que el estilo que le continua es de dos niveles.

¿Cuales son los tipos de ventas mas utilizados?

pregunta3A

En la grafica anterior, claramente se puede apreciar que la diferencia es abrupta en el metodo o el tipo de venta de la propiedad, dicho metodo es el WD, el cual quitando la abreviatura seria: “Warranty Deed”, o traducido, con garantia escrita, lo que se conoce como el metodo convencional o tradicional.

En que condiciones son vendidas y cual es la que sobresale

pregunta4A

La variable, condiciones de venta hace referencia a bajo que cirscuntancias fue vendida la propiedad, en este caso existen 6 tipos de condiciones, pero, como se puede apreciar en la grafica anterior, la condicion en la que se vende mayormente es de Normal, lo cual es considerado como lo Normal, la condicion que le sigue, es Partial, el cual es parcial, lo que hace referencia a que la casa aun no estaba completa cuando fue comprada, esto es mayormente con las casas nuevas.

¿Cual es el mes que registra una mayor venta?

pregunta5A

Como se puede apreciar en la grafica anterior, el mes que cuenta con los mayores registros de ventas en el numero 6, o lo que es igual a Junio, seguido del mes 7, lo que es Julio.

¿En qué zona se han hecho más ventas?

pie(table_zona, labels = lbls, col=rainbow(length(lbls)), main="")

Del gráfico de pie anterior, se puede concluir que la zona en que más ventas se han realizado es RL con un 79%, lo que significa que la zona Residential Low Density es donde han ocurrido la mayoría de las ventas, siendo 1151 ventas de 1460 ventas realizadas en total.

¿Qué tipo de carretera de acceso tienen la mayoría de las viviendas?

pie(table_calle, labels = lbls1, col=rainbow(length(lbls1)), main="")

En base al gráfico anterior, se concluye que la mayoría de las viviendas cuentan con una carretera de acceso pavimentada, siendo una cantidad de 1454 viviendas con carretera pavimentada, dejando unas 6 viviendas con carretera de grava.

¿Qué forma tienen las viviendas que más se han vendido?

pregunta3E

En el gráfico observamos que de todas las ventas, las viviendas de forma regular son las que más se han vendido. de 1460 viviendas, 925 tienen forma regular (Reg), 484 tienen forma ligeramente irregular (IR1), 41 tienen forma moderadamente irregular (IR2) y 10 tienen forma irregular (IR3).

3. Analisis de grupos

Variables utilizadas:

-Cuantitativas:

LotFrontage: Pies lineales de calle conectados a la propiedad.

scatter.smooth(data$LotFrontage, data$SalePrice)

LotArea: Tamaño del lote en pies cuadrados.

scatter.smooth(data$LotArea, data$SalePrice)

BsmtUnfSF: Pies cuadrados sin terminar del área del sótano.

scatter.smooth(data$BsmtUnfSF, data$SalePrice)

TotalBsmtSF: Pies cuadrados totales del área del sótano.

scatter.smooth(data$TotalBsmtSF, data$SalePrice)

1stFlrSF: Pies cuadrados del primer piso.

scatter.smooth(data$X1stFlrSF, data$SalePrice)

GrLivArea: Pies cuadrados de superficie habitable sobre el nivel del suelo (suelo).

scatter.smooth(data$GrLivArea, data$SalePrice)

GarageArea: Tamaño del garaje en pies cuadrados.

scatter.smooth(data$GarageArea, data$SalePrice)

#### -Cualitativas:

YearBuilt: Fecha original de construcción.

scatter.smooth(data$YearBuilt, data$SalePrice)

YearRemodAdd: Fecha de remodelación (igual que la fecha de construcción si no hay remodelaciones ni adiciones).

scatter.smooth(data$YearRemodAdd, data$SalePrice)

GarageYrBlt: Año de construcción del garaje.

scatter.smooth(data$GarageYrBlt, data$SalePrice)

MoSold: Mes vendido (MM).

scatter.smooth(data$MoSold, data$SalePrice)

Las gráficas anteriores nos ayuda a determinar qué tanta correlación existe entre cada una de las variables y el precio de venta de la vivienda. Mientras más cerca los puntos estén de la línea, mayor es la correlación.

De estas gráficas se puede concluir que las variables seleccionadas están lo suficientemente relacionadas con el precio de venta, éstas variables se utilizarán para la realización de los árboles de decisión. Se tomó en cuenta cada variable para determinar si es prudente usarlas en todos los casos o no, para evitar análisis innecesarios e irrelevantes.

4. Set de datos entrenamiento y prueba

Para esta seccion fue necesario establecer el porcentaje de datos que utilizara cada conjunto, donde el 70% de datos sera para los datos de prueba y el; 30% para los datos de entrenamiento. Cabe mencionar, que las variables puestas a prueba son las variables numericas